- 資料科學家是「數位趨勢觀察家」與「把散落的資訊整合成動人故事的說書人」的合體。這些專家或團隊拿著篩子濾過巨量的資料,並且從當中尋找新發現。-Anjul Bhambhri,IBM 巨量資料產品部門副總裁.
- 資料科學家擁有獨特的技能組合,能從資料本身當中釋放出洞見,同時並能用資料說出動人的故事。 -Dr. DJ Patil,現任 Greylock Partners 資料科學家,前任 LinkedIn Corporation 的首席科學家、首席安全官,以及資料與分析團隊主持人。
- 資料科學家是罕見的混合型人才,他必須是電腦科學家,能夠撰寫程式、開發工具,來挖掘、整合以及管理多元來源的資料;他也必須是統計學家,知道如何從資訊之中提煉洞見;他必須同時具備創意與嚴謹,綜合多種技能開發出新的原型工具,來探索各種資料背後深刻的意義。-Jake Porway, Data without Borders and New York Times.
- 資料科學家是「具有分析思維,對統計與數學有深刻理解的資料工程師,他們可以從大量的資料當中探索商業或其他複雜系統當中的洞見」-Steve Hillion, EMC Greenplum 分析部門副總裁
2012/08/27
[Data Analytics] 資料科學家
前面簡短的介紹過了「資料科學」,相對應的就應該有「資料科學家」這樣的角色,我們可以看看一些資深業界人士的看法:
2012/08/24
[摘譯] 相變材質帶來新的建材
原文:Game changer? Phase-change products boost building performance | SmartPlanet
西班牙馬德里的 Polytechnic 大學開發了一種石蠟隔板,透過石蠟粒子「白天吸熱,晚上放熱」的特性,可以讓建築物的能源使用下降 40%。
除了塗料之外,相變材質也可以用噴劑的方式存在。2011 年,University of Nottingham 在中國寧波的分校,也開發出特殊的熱調節材料,混合在建築塗料中應用。
PCM 建材的作用,主要都是透過「延後導熱」或「選擇性導熱」這樣的特性,讓建築本身在環境溫度變化到某個程度時,可以在環境中展現不同的熱屬性,達到溫度調節的效果。
雖然相變材料還是很新的主題,但是其實市場上已經存在很多選擇,像是 RavenBrick 就有提供磚頭、窗戶、塗料等等。這些材料也衍生出更多進階的應用,例如 MIT 的智慧型屋頂。
除了建材之外,相變材質其實也咬就大量應用在保溫、加熱的小家電,以及各種行動裝置上,不過這些小面積的應用對環境溫度的調節沒有明顯的效果就是了。
譯按:相變材質(Phase-change materials, PCMs)主要是利用物質在發生相位變化(凝結/氣化、凝固/融解....等等)時所伴隨的潛熱(latent heat)吸收或釋放,來作為特定的功能。一般來說,會選擇在特定溫度(例如室溫)發生相變(例如固態與液態之間的轉變),而潛熱量大的物質。例如乙酸納製的暖暖包,就是一種相變材質的應用。相變材質可透過潛熱的吸收與釋放來調節周遭的溫度,這種材料在建築上的應用有不斷加速的趨勢。
西班牙馬德里的 Polytechnic 大學開發了一種石蠟隔板,透過石蠟粒子「白天吸熱,晚上放熱」的特性,可以讓建築物的能源使用下降 40%。
除了塗料之外,相變材質也可以用噴劑的方式存在。2011 年,University of Nottingham 在中國寧波的分校,也開發出特殊的熱調節材料,混合在建築塗料中應用。
PCM 建材的作用,主要都是透過「延後導熱」或「選擇性導熱」這樣的特性,讓建築本身在環境溫度變化到某個程度時,可以在環境中展現不同的熱屬性,達到溫度調節的效果。
雖然相變材料還是很新的主題,但是其實市場上已經存在很多選擇,像是 RavenBrick 就有提供磚頭、窗戶、塗料等等。這些材料也衍生出更多進階的應用,例如 MIT 的智慧型屋頂。
除了建材之外,相變材質其實也咬就大量應用在保溫、加熱的小家電,以及各種行動裝置上,不過這些小面積的應用對環境溫度的調節沒有明顯的效果就是了。
2012/08/13
[Data Analytics] 氣候資料探勘
氣候研究領域一直有「遙相關」(telecorrelation)的研究,主要是透過分析長期資料,找出氣象參數高度相關的地點,然後嘗試從物理的觀點來詮釋這個現象。Kumar 將資料探勘當中的 Association Rule Learning 與遙相關的研究傳統結合,進而發展出一系列新的演算法,適用於「時空分布」性質的資料,大幅拓展了 association analysis 的適用範圍。
此外,Kumar 也將氣候資料與生態資料合併分析,建立了時空分布資料變化的自動偵測系統,而這個系統後來被應用在衛星監測的技術上,觀測地球表面生態系統的變化。
Kumar 教授是大型前瞻計畫 Understand Climate Change: a data-driven approach 與 GOPHER: Global Observation for Planetary Health and Resources 的主持人,這也算是 Big Data 趨勢當中的新資料型態的應用。不過 NoSQL 應當是另一個主題,之後再專文討論吧。
Labels:
data analytics,
tech
2012/08/09
從 MVC 到 MOVE
三層架構的 MVC (Model-View-Controller,中文介紹) 模式,大概是目前軟體工程最廣為人知的基本架構,尤其是在網路服務成為資訊系統的主流之後,J2EE ,Windows Forms,Perl,Ruby on Rails 等等,都對此架構有相當好的定義與支援。
日前,一位 LinkedIn 的工程師 Conrad Irwin 基於工作中使用 MVC 架構遇到的困難,提出了 MOVE (Model-Operation-View-Event,中文介紹) 架構。MOVE 並不是全新的架構,而是把原本的 Controller 再區分成 Operation 與 Event,以期更能適應現在新的程式開發環境。
在 MVC 架構提出的時候,應用程式的各個元件大多是在同一台主機上執行,但是隨著時代的改變,分散式運算以及非同步更新逐漸普及, MOVE 在這些新的運算環境下或許真的是個不錯的架構。
日前,一位 LinkedIn 的工程師 Conrad Irwin 基於工作中使用 MVC 架構遇到的困難,提出了 MOVE (Model-Operation-View-Event,中文介紹) 架構。MOVE 並不是全新的架構,而是把原本的 Controller 再區分成 Operation 與 Event,以期更能適應現在新的程式開發環境。
在 MVC 架構提出的時候,應用程式的各個元件大多是在同一台主機上執行,但是隨著時代的改變,分散式運算以及非同步更新逐漸普及, MOVE 在這些新的運算環境下或許真的是個不錯的架構。
Labels:
tech
2012/08/05
[Data Analytics] 資料科學 Data Science
什麼是「資料科學」(Data Science)?
根據 Christian Langreiter 有點酸的 twitter 留言,「所謂的資料科學家,指的是居住在加州某個地區,或是在 bitly 上班的統計學家」。言下之意,資料科學只不過是統計學的新包裝罷了。
今年六月,O'Reilly Media 的副總裁 Mike Loukides 日前發表了一本小書:what is data science? ,倒是為這個問題做了比較正式的回答。
書中從目前常見的 data-driven services 開始切入,分別從「資料哪裡來?」、「與大量的資料共舞」、「讓資料說故事」,以及「資料科學家」四個主題,來介紹資料科學。
有興趣的讀者可以參考原文,當中介紹了相當多的應用實例以及工具。簡單的來說,目前的資料科學,相較於傳統的統計學,在資料來源、分析處理方式、視覺呈現,以及從事這項工作所需具備的技能上都有些許的差別。
資料科學在文中被喻為是「未來的 Intel inside」,而能夠「獲取資料,理解資料,處理資料,從當中萃取價值,將之視覺化,並用來與人跟溝通」的能力,則會是未來十年產業急切需要的。
不知道除了文中介紹的幾個國際大廠之外,其他的科技業者準備好了嗎?
根據 Christian Langreiter 有點酸的 twitter 留言,「所謂的資料科學家,指的是居住在加州某個地區,或是在 bitly 上班的統計學家」。言下之意,資料科學只不過是統計學的新包裝罷了。
今年六月,O'Reilly Media 的副總裁 Mike Loukides 日前發表了一本小書:what is data science? ,倒是為這個問題做了比較正式的回答。
書中從目前常見的 data-driven services 開始切入,分別從「資料哪裡來?」、「與大量的資料共舞」、「讓資料說故事」,以及「資料科學家」四個主題,來介紹資料科學。
有興趣的讀者可以參考原文,當中介紹了相當多的應用實例以及工具。簡單的來說,目前的資料科學,相較於傳統的統計學,在資料來源、分析處理方式、視覺呈現,以及從事這項工作所需具備的技能上都有些許的差別。
資料科學在文中被喻為是「未來的 Intel inside」,而能夠「獲取資料,理解資料,處理資料,從當中萃取價值,將之視覺化,並用來與人跟溝通」的能力,則會是未來十年產業急切需要的。
不知道除了文中介紹的幾個國際大廠之外,其他的科技業者準備好了嗎?
Labels:
data analytics,
tech,
thoughts
訂閱:
文章 (Atom)